7 research outputs found

    Methods for fast and reliable clustering

    Get PDF

    Outlier detection using k-nearest neighbour graph

    No full text
    We present an Outlier Detection using Indegree Number (ODIN) algorithm that utilizes k-nearest neighbour graph. Improvements to existing kNN distance-based method are also proposed. We compare the methods with real and synthetic datasets. The results show that the proposed method achieves resonable results with synthetic data and outperforms compared methods with real data sets with small number of observations. 1

    Is Speech Data Clustered? - Statistical Analysis of Cepstral Features

    No full text
    Speech analysis applications are typically based on short-term spectral analysis of the speech signal. Feature extraction process outputs one feature vector per frame. The features are further processed by application-dependent techniques, such as hidden Markov models or vector quantization. Independent from the application, it is often desirable that the feature vectors form separable clusters in the feature space. In this work, we study whether data is really clustered in the feature space and, if so, what is the number of the clusters in typical speech data. We consider different forms of the widely used cepstral features

    Samordning av grundvattenskyddet och stenmaterialförsörjningen : Slutrapport för Nyland och Östra Nyland

    Get PDF
    Pohjavesien suojelun ja kiviaineshuollon yhteensovittamista (POSKI-projekti) selvitettiin Uudenmaan ja Itä-Uudenmaan maakunnissa vuosina 1998 - 2004. Tavoitteena oli turvata geologisen luonnon ympäristöarvot, hyvälaatuinen pohjavesi yhdykuntien vesihuoltoon sekä laadukkaiden kiviainesten saanti yhdyskuntarakentamiseen. Selvitysalueella on 520 pohjavesialuetta, joista vedenhankintakäytössä on 345 kappaletta. Niiden arvioitu antoisuus on noin 248 000 m3/d. Käyttämättömiä vedenhankintaan soveltuvia pohjavesivaroja selvitysalueella on 99 pohjavesialueella noin 33 000 m3/d. Normaaliolosuhteissa pohjavesivarat riittävät tyydyttämään alueen tarpeen. Selvitysalueen pohjavesialueet kuuluvat kuitenkin riskialtteimpiin Suomessa. Poikkeusolosuhteiden tai mahdollisten vedenottamoiden likaantumistapausten varalta korvaavat pohjavesivarat ovat pienet ja vaikeasti hyödynnettävät. Selvitysalueen pohjavesipinnan yläpuoliset hiekka-ja soravarat ovat yhteensä noin 1 770 milj.k-m3. Näistä suurin osa sijaitsee alueilla, jotka eivät selvitystyön perusteella sovellu maa-ainesten ottoon. Maa-ainesten ottoon soveltuvilla ja osittain soveltuvilla alueilla arvioidaan olevan hiekka-ja soravaroja noin 64 milj.k-m3:ksi. Nämä ovat laadultaan valtaosaltaan hiekkaa. Soraa ja karkeampaa ainesta tästä on alle 15 milj. k-m3, mikä nykyisillä harjukiviainesten käyttömäärillä vastaa vajaan neljän vuoden tarvetta. Käytännössä selvitysalueen hiekka- ja soravarat eivät ole enää pitkään aikaan riittäneet tyydyttämään tarvetta, vaan sorajalosteita on tuotu Etelä-Hämeestä. Selvitysalueen tutkitut kalliokiviainesvarat maanpinnan 0-tasoon laskettuna ovat noin 2 520 milj.k-m3. Tästä määrästä maa-ainesten ottoon soveltuvilla alueilla on reilut 420 milj.k-m3 ja 10 m maanpinnan 0-tason alapuolelle laskettuna reilut 700 milj.k-m3. Tulosten perusteella näyttää siltä, että merkittävä osa alueen kiviaineshuollosta voidaan vielä järjestää kalliokiviaineksiin perustuen, mikäli kiviaineshuolto huomioidaan aikaisempaa tarkemmin maankäytön suunnittelussa

    The I4U system in NIST 2008 speaker recognition evaluation

    No full text
    This paper describes the performance of the I4U speaker recognition system in the NIST 2008 Speaker Recognition Evaluation. The system consists of seven subsystems, each with different cepstral features and classifiers. We describe the I4U Primary system and report on its core test results as they were submitted, which were among the bestperforming submissions. The I4U effort was led by th
    corecore